En este cuaderno vamos a procesar un conjunto de datos para posteriormente realizar un Análisis Factorial a partir de los microdatos del informe PISA(informe del Programa para la Evaluación Internacional de los Estudiantes) en España en el año 2018.

Para ello, usaremos datos de la prueba PISA del año 2018 que pueden descargarse en el siguiente link: https://www.educacionyfp.gob.es/inee/bases-datos/evaluaciones-internacionales/pisa.html. Se pueden descargar en el siguiente link en formato SPSS o SAS y nosotros transformaremos a un excel los que nos interesan.

Tomamos el fichero “Datos_PISA_ESP.csv”

Específicamente, estos datos proceden del Cuestionario de contexto del alumno, cuestionario que deben rellenar todos los alumnos que pasan PISA y que trata de medir la existencia de variables socioeconómicas, metacognitivas, motivacionales e, incluso, emocionales, que pueden tener impacto sobre el rendimiento académico. Entre las variables relacionadas con la motivación podemos encontrar:

Pero, para simplificar más las cosas y no trabajar con un número considerable de factores, nos vamos a centrar simplemente en tres: la competitividad, la perseverancia y el miedo al fracaso.

Los items (preguntas) que miden respectivamente la competitividad, al perseverancia y el miedo al fracaso de los estudiantes son:

  1. ¿Hasta qué punto estás de acuerdo con las siguientes afirmaciones sobre ti mismo?
  1. ¿Hasta qué punto estás de acuerdo con las siguientes afirmaciones sobre ti mismo?
  1. ¿Hasta qué punto estás de acuerdo con las siguientes afirmaciones?

La escala de respuesta para estos tres conjuntos de ítems es la misma: 1 - Totalmente en desacuerdo, 2 - En desacuerdo, 3 - De acuerdo y 4 - Totalmente de acuerdo.

Procesamos el dataset para adaptarlo a lo de arriba

# Librería tratamiento dataframes
library(dplyr)


# Microdatos
# Fichero Personas
datos <- read.csv("/Users/davpero/Downloads/Datos_PISA_ESP.csv", sep=";", dec=",")
#Este csv esta separado por ; y los decimales son ,
dim(datos) #Tenemos 35943 observaciones y 37 columnas
head(datos)
#Vamos a extraer simplemente las columnas de identificador del alumno y las de los items que nos interesan (los que miden la competitividad, la perseverancia y el miedo al fracaso):
datos <- datos[,c("CNTSTUID", "ST181Q02HA", "ST181Q03HA", "ST181Q04HA", "ST182Q03HA", "ST182Q04HA", "ST182Q05HA", "ST182Q06HA", "ST183Q01HA", "ST183Q02HA", "ST183Q03HA")]
# Creamos excel con datos
library("writexl")
write_xlsx(datos, "../../../../files/pisa_factorial.xlsx")

Este dataset será el que se proporcione para el estudiante para hacer sus análisis. pisa_factorial.xlsx

Back to top